线性回归:Sklearn与Excel

本文对比了在Excel和Scikit-learn中执行线性回归的预测精度。通过10万个气象数据,使用降水量、最低温度和最高温度预测风速,发现Excel能快速得出线性回归模型,但Scikit-learn在调整超参数后,预测结果更接近实际值。尽管Excel适用于快速近似预测,但在模型精度和复杂性上,Scikit-learn更具优势。
摘要由CSDN通过智能技术生成

作者|Kaushik Choudhury 编译|VK 来源|Towards Data Science

大约13年前,David Cournapeau的Scikit learn作为Google Summer of Code项目的一部分开始。随着时间的推移,Scikit learn成为Python中最著名的机器学习库之一。它提供了几种分类、回归和聚类算法,在我看来,它的关键优势是与Numpy、Pandas和Scipy无缝集成。

在本文中,我将用excel比较Scikit-learn多元线性回归的预测精度。Scikit-learn提供了许多参数(称为估计器(estimator)的超参数)来微调模型的训练并提高预测的准确性。

在excel中,我们没有太多的东西可以调整回归算法。为了公平比较,我将使用默认参数训练sklearn回归模型。


目的

此比较旨在了解excel和Scikit learn中线性回归的预测精度。另外,我将简要介绍在excel中执行线性回归的过程。

示例数据文件

为了进行比较,我们将使用10万个降水量、最低温度、最高温度和风速的数据集。工作人员在8年中的每一天进行测量多次从而得到了这些数据。

我们将利用降水量、最低气温和最高气温来预测风速。因此,风速是因变量,其他数据是自变量。


我们将首先在excel上建立和预测风速的线性回归模型。然后我们将使用Scikit learn进行相同的练习,最后,我们将比较预测结果。

要在excel中执行线性回归,我们将打开示例数据文件并单击excel功能区中的“Data”选项卡。在“Data”选项卡中,选择数据分析选项。

提示:如果看不到“数据分析”选项,请单击 File > Opt

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值